机器学习模型在我们的生活中越来越普遍,例如协助进行图像分类或决策任务。因此,这些模型的可靠性至关重要,并导致开发了许多验证和验证其稳健性和公平性的方法。但是,除了这样的特定属性之外,指定模型的一般功能校正期望是具有挑战性的。在本文中,我们从正式方法中使用的规格中汲取灵感,通过推理约$ k $不同的执行,即所谓的$ k $ -safety属性来表达功能校正属性。考虑到银行的信用筛查模型,“如果一个人被拒绝贷款并减少其收入,他们仍然应该被拒绝贷款”,这是2范围的财产。在这里,我们显示了用于机器学习模型的$ K $ - 安全性属性的广泛适用性,并介绍了表达它们的第一个规范语言。我们还在使用变质测试自动验证此类属性的框架中操作该语言。我们的实验表明,我们的框架有效地识别违反财产的行为,并且可以使用检测到的错误来训练更好的模型。
translated by 谷歌翻译
基于块的视觉编程环境越来越多地用于向初学者介绍计算概念。鉴于编程任务是开放式和概念的,新手学生在这些环境中学习时经常挣扎。 AI驱动的编程导师在自动协助苦苦挣扎的学生方面拥有巨大的希望,并且需要几个组件来实现这一潜力。我们特别研究学生建模的关键组成部分,特别是自动推断学生对预测(合成)行为的误解的能力。我们介绍了一个小说的基准,Sudendyn,以以下挑战为中心:对于给定的学生,在观察学生对固定参考任务的尝试后,综合了学生对新目标任务的尝试。这个挑战类似于程序合成。但是,与其综合{solution}(即,专家会编写的程序),不如说是综合一个{student of trim}(即给定学生会写作的程序)。我们首先表明人类专家(导师)可以在基准上实现高性能,而简单的基线表现不佳。然后,我们开发了两种神经/符号技术(神经和符号),以寻求用导师缩小这一差距。
translated by 谷歌翻译
实际因果关系和紧密相关的责任归因概念对于负责任的决策至关重要。实际因果关系侧重于特定结果,并旨在确定对实现兴趣结果至关重要的决策(行动)。责任归因是互补的,旨在确定决策者(代理人)对此结果负责的程度。在本文中,我们研究了在不确定性下用于多代理顺序决策的广泛使用框架下的这些概念:分散的部分可观察到的马尔可夫决策过程(DEC-POMDPS)。在RL中显示了POMDP和结构因果模型(SCM)之间的对应关系之后,我们首先在DECPOMDPS和SCMS之间建立了联系。此连接使我们能够利用一种语言来描述先前工作中的实际因果关系,并研究DECOMDPS中实际因果关系的现有定义。鉴于某些众所周知的定义可能导致违反直觉的实际原因,我们引入了一个新颖的定义,该定义更明确地说明了代理人行为之间的因果关系。然后,我们根据实际因果关系转向责任归因,我们认为,在将责任归因于代理商时,重要的是要考虑代理人参与的实际原因数量以及操纵自己的责任程度的能力。在这些论点的激励下,我们介绍了一种责任归因方法,该方法扩展了先前的工作,同时考虑到上述考虑因素。最后,通过基于仿真的实验,我们比较了实际因果关系和责任归因方法的不同定义。经验结果证明了实际因果关系的定义与其对归因责任的影响之间的定性差异。
translated by 谷歌翻译
我们研究奖励设计策略,用于激励加强学习代理,从一系列可接受的政策中采用政策。奖励设计师的目标是经济高效地修改底层奖励功能,同时确保在新奖励功能下的任何大约最佳的确定性政策是可允许的,并且在原始奖励功能下执行良好。这个问题可以被视为最佳奖励中毒攻击问题的双重问题:而不是强制代理商采用特定的政策,而奖励设计师则激励一个代理人以避免采取某些州不可受理的行动。也许令人惊讶的是,与最佳奖励中毒攻击的问题相比,我们首先表明可允许的政策教学的奖励设计问题是在计算上具有挑战性的,并且难以找到近似最佳的奖励修改。然后,我们通过制定最佳解决方案的代理问题,其最佳解决方案近似于我们的环境中奖励设计问题的最佳解决方案,但更适用于优化技术和分析。对于此替代问题,我们呈现了在最佳解决方案的值上提供限制的表征结果。最后,我们设计了一个本地搜索算法来解决代理问题,并使用基于模拟的实验展示其实用程序。
translated by 谷歌翻译
我们研究了积极学习的问题,即学习者通过乐于助人的老师辅助的扭曲。我们考虑以下自然交互协议:在每一轮时,学习者提出了一个查询询问实例$ x q $的标签,老师提供请求的标签$ \ {x ^ q,y ^ q \} $通过解释信息来指导学习过程。在本文中,我们以额外的对比示例的形式查看此信息($ \ {x ^ c,y ^ c} $),其中$ x ^ c $摘自$ x ^ q $(例如,具有相同标签的异种情况)。我们的重点是设计一种教学算法,可以向学习者提供信息的对比序列,以加快学习过程。我们表明这导致了一个具有挑战性的序列优化问题,其中算法在给定轮的选择取决于交互历史。我们调查了一种高效的教学算法,可自适应地选择这些对比示例。我们基于两个问题依赖性参数促进了我们的算法的强大性能保障,进一步表明,对于特定类型的活跃学习者(例如,广义二进制搜索学习者),所提出的教学算法表现出强烈的近似保证。最后,我们通过两个数值案例研究说明了我们的界限并展示了我们的教学框架的有效性。
translated by 谷歌翻译
我们考虑通过序贯决策设置中的示范教学问题。特别是,我们研究如何在演示中设计一个个性化课程,以加快学习者的融合。我们为两种流行的学习者型号提供统一的课程策略:最大因果熵逆加强学习(MaxEnt-IRL)和交叉熵行为克隆(Crossent-BC)。我们的统一战略基于难度评分计算的概念来突出排名。教师的最佳政策和学习者的当前政策。与现有技术相比,我们的战略不需要访问学习者的内部动态,并且在轻度技术条件下仍然享有类似的收敛保证。此外,我们将我们的课程策略调整到使用特定于任务特定难度分数的教师代理的环境。在合成车驾驶环境和基于导航环境的实验证明了我们课程策略的有效性。
translated by 谷歌翻译
Cutting-edge diffusion models produce images with high quality and customizability, enabling them to be used for commercial art and graphic design purposes. But do diffusion models create unique works of art, or are they stealing content directly from their training sets? In this work, we study image retrieval frameworks that enable us to compare generated images with training samples and detect when content has been replicated. Applying our frameworks to diffusion models trained on multiple datasets including Oxford flowers, Celeb-A, ImageNet, and LAION, we discuss how factors such as training set size impact rates of content replication. We also identify cases where diffusion models, including the popular Stable Diffusion model, blatantly copy from their training data.
translated by 谷歌翻译
We present a framework for ranking images within their class based on the strength of spurious cues present. By measuring the gap in accuracy on the highest and lowest ranked images (we call this spurious gap), we assess spurious feature reliance for $89$ diverse ImageNet models, finding that even the best models underperform in images with weak spurious presence. However, the effect of spurious cues varies far more dramatically across classes, emphasizing the crucial, often overlooked, class-dependence of the spurious correlation problem. While most spurious features we observe are clarifying (i.e. improving test-time accuracy when present, as is typically expected), we surprisingly find many cases of confusing spurious features, where models perform better when they are absent. We then close the spurious gap by training new classification heads on lowly ranked (i.e. without common spurious cues) images, resulting in improved effective robustness to distribution shifts (ObjectNet, ImageNet-R, ImageNet-Sketch). We also propose a second metric to assess feature reliability, finding that spurious features are generally less reliable than non-spurious (core) ones, though again, spurious features can be more reliable for certain classes. To enable our analysis, we annotated $5,000$ feature-class dependencies over {\it all} of ImageNet as core or spurious using minimal human supervision. Finally, we show the feature discovery and spuriosity ranking framework can be extended to other datasets like CelebA and WaterBirds in a lightweight fashion with only linear layer training, leading to discovering a previously unknown racial bias in the Celeb-A hair classification.
translated by 谷歌翻译
深度神经网络(DNN)几乎在商业,技术和科学上几乎普遍存在计算机视觉任务中实现了前所未有的表现。尽管为高度准确的体系结构而做出了大量的努力并提供了可用的模型解释,但大多数最先进的方法首先是为自然视觉设计的,然后转换为医疗领域。本论文旨在通过提出新的体系结构来解决这一差距,这些新型体系结构将医学成像的特定域约束纳入DNN模型和解释设计。
translated by 谷歌翻译
建模是什么使广告有说服力的原因,即引起消费者的所需响应,对于宣传,社会心理学和营销的研究至关重要。尽管其重要性,但计算机视觉中说服力的计算建模仍处于起步阶段,这主要是由于缺乏可以提供与ADS相关的说服力标签的基准数据集。由社会心理学和市场营销中的说服文学的激励,我们引入了广泛的说服策略词汇,并建立了用说服策略注释的第一个AD图像语料库。然后,我们通过多模式学习制定说服策略预测的任务,在该任务中,我们设计了一个多任务注意融合模型,该模型可以利用其他广告理解的任务来预测说服策略。此外,我们对30家财富500家公司的1600个广告活动进行了真实的案例研究,我们使用模型的预测来分析哪些策略与不同的人口统计学(年龄和性别)一起使用。该数据集还提供图像分割掩码,该蒙版在测试拆分上标记了相应的AD图像中的说服力策略。我们公开发布代码和数据集https://midas-research.github.io/persuasion-avertisements/。
translated by 谷歌翻译